CatBoost এর মাধ্যমে Training এবং Testing Dataset তৈরি করা

CatBoost (Categorical Boosting) হল Yandex দ্বারা তৈরি একটি উন্নত Gradient Boosting লাইব্রেরি, যা বিশেষ করে ক্যাটেগোরিক্যাল ডেটা পরিচালনা করার জন্য ডিজাইন করা হয়েছে। CatBoost সহজে ব্যবহারযোগ্য এবং উচ্চ কার্যকারিতা প্রদান করে। এখানে CatBoost ব্যবহার করে Training এবং Testing Dataset তৈরি করার প্রক্রিয়া আলোচনা করা হলো।

CatBoost দিয়ে Training এবং Testing Dataset তৈরি করার প্রক্রিয়া

১. CatBoost ইনস্টল করা

প্রথমেই আপনার সিস্টেমে CatBoost ইনস্টল করতে হবে। Python-এর জন্য এটি Pip ব্যবহার করে ইনস্টল করা যেতে পারে:

pip install catboost

২. ডেটাসেট প্রস্তুতি

একটি সাধারণ ডেটাসেট তৈরি করুন বা কোনও পাবলিক ডেটাসেট ব্যবহার করুন। এখানে আমরা একটি কল্পিত ডেটাসেট ব্যবহার করছি, তবে আপনি নিজের ডেটা ব্যবহার করতে পারেন।

import pandas as pd
from sklearn.model_selection import train_test_split

# উদাহরণস্বরূপ একটি ডেটাসেট তৈরি করুন
data = {
    'feature1': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    'feature2': ['A', 'B', 'A', 'B', 'A', 'B', 'A', 'B', 'A', 'B'],
    'target': [0, 1, 0, 1, 0, 1, 0, 1, 0, 1]
}
df = pd.DataFrame(data)

# ডেটা ভাগ করা: 80% ট্রেনিং এবং 20% টেস্টিং
X = df[['feature1', 'feature2']]
y = df['target']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print("Training set:")
print(X_train)
print(y_train)

print("\nTesting set:")
print(X_test)
print(y_test)

৩. CatBoost দিয়ে Training Dataset প্রস্তুতি

CatBoost ব্যবহার করার জন্য ক্যাটেগোরিক্যাল বৈশিষ্ট্যগুলির জন্য একটি তালিকা তৈরি করুন এবং CatBoostClassifier অথবা CatBoostRegressor ব্যবহার করে মডেল তৈরি করুন।

from catboost import CatBoostClassifier

# ক্যাটেগোরিক্যাল বৈশিষ্ট্যগুলি উল্লেখ করুন
categorical_features_indices = [1]  # feature2 হল ক্যাটেগোরিক্যাল ফিচার

# CatBoostClassifier মডেল তৈরি করা
model = CatBoostClassifier(iterations=100, learning_rate=0.1, depth=6, cat_features=categorical_features_indices, verbose=0)

# মডেল প্রশিক্ষণ
model.fit(X_train, y_train)

৪. Testing Dataset-এর উপর মডেল পরীক্ষা করা

প্রশিক্ষিত মডেলটি টেস্টিং ডেটাসেটের উপর পরীক্ষা করুন এবং ফলাফল মূল্যায়ন করুন।

# ভবিষ্যদ্বাণী করা
predictions = model.predict(X_test)

# ফলাফল দেখানো
print("\nPredictions:")
print(predictions)

# সঠিকতা মূল্যায়ন
from sklearn.metrics import accuracy_score

accuracy = accuracy_score(y_test, predictions)
print(f"\nAccuracy: {accuracy * 100:.2f}%")

উপসংহার

CatBoost ব্যবহার করে Training এবং Testing Dataset তৈরি করা একটি সহজ এবং কার্যকর প্রক্রিয়া। এই প্রক্রিয়ায় ডেটা প্রস্তুতি, মডেল প্রশিক্ষণ এবং টেস্টিং অন্তর্ভুক্ত রয়েছে। CatBoost এর শক্তিশালী বৈশিষ্ট্য এবং ক্যাটেগোরিক্যাল ডেটার জন্য বিশেষায়িত কৌশল ব্যবহার করে এটি উচ্চমানের ফলাফল প্রদান করতে সক্ষম।

Content added By

আরও দেখুন...

Promotion